OECD Endüstriyel Üretim Verilerinde Bulunan Kayıp Verilerin kNN Yöntemi İle Tahmini
نویسندگان
چکیده
Ekonomik İşbirliği ve Kalkınma Örgütü (OECD), daha iyi yaşamlar oluşturmak için çalışan uluslararası bir organizasyondur. Bu amaç doğrultusunda OECD ülkeler hakkında birçok göstergede veri toplamaktadır. Daha doğru analizler yapabilmek bu verilerin eksiksiz olması gerekmektedir. Fakat ulusal farklı kaynaklardan toplanan bilgilerde eksiklikler olmaktadır. özellikle istatiksel analiz makine öğrenmesi yöntemleri kullanarak çalışmak isteyen araştırmacılara problem çıkartmaktadır. tür setlerinin öncelikle eksik verilerden temizlenmesi Genel olarak veriler istatistiksel analizleri üzerinde olumsuz etkiye sahiptir. sorunu çözmek geleneksel modern yöntemler vardır. Değişkenler tamamen rastgele (MCAR), (MAR) değil (MNAR) olabilir. neden ile her değişken ayrı ele alınmalıdır. Temel Göstergeler tabanı içerisindeki endüstriyel üretim başlıklı setinde 34 ülkeye ait 113 3933 tam olmak üzere 4046 değer bulunmaktadır. Veri setini gruplara ayırmak çalışmada k-en yakın komşu (kNN) adı verilen öğrenimi algoritmasını kullanılmış. kNN algoritması kullanımının basit olduğundan yaygın kullanılmaktadır. Çalışmada kullanılan algoritmaya en komşuluk değeri k=15 belirlenmiştir. Eksik verileri tahmin etmede %86,8’lik başarı elde edilmiştir.
منابع مشابه
Karar Tablosu Destekli Olay Sira Cizgeleri Temelli Sinama Durum Uretim Araci
Özet. Model temelli sınama alanında otomatik sınama durum üretimi önemli konuların başında gelir. Otomatik sınama durum üretimi için formel bir modelleme yöntemi ile üretim için algoritmalar gereklidir. Bu bildirinin ilk yazarının geliştirdiği Olay Sıra Çizgeleri (İng. Event Sequence Graphs) formel modelleme yöntemi ve sınama durum üretim algoritmaları, bu bildirinin diğer yazarları tarafından ...
متن کاملYazilim Maliyet Tahmininde Yapay Sinir Aglari Kullanimi
Özet. Yazılım maliyet tahmini, proje yöneticilerini her daim zorlayan işlerin başında gelmiştir. Yapılan tahmini gerçek değere yaklaştırmak, yazılım geliştirme süreci boyunca süre ve bütçe kısıtlarını daha iyi kontrol edebilmek demektir. Akademik yazında, her birinin kendine has olumlu veya olumsuz yönleri olan birden fazla tahmin yöntemi önerilmiştir. Bu makalede, özellikleri iyi bilinen bir y...
متن کاملKisa Donem Uzam-Zamansal Trafik Tahmini
The studies carried out with the objective of minimizing the effects of congestion, delay and environment problems on the transportation network have gained increasing importance in the last years. Among these studies, short-term traffic flow and average vehicle speed forecasting methods have come into prominence due to their easy implementations, efficient usage on different areas and cost-eff...
متن کاملYazilim Gelistirme Surecinde Deger Akis Haritalama Yontemi Uygulama Calismasi
Özetçe. Üretim alanında başarılı sonuçlar elde edilmesini sağlayan süreç iyileştirme yaklaşımlarının Yazılım Geliştirme alanında da uygulanmaya alınması ile yazılım geliştirme süreçlerinde yaşanan sorunların aşılmasına yönelik adımlar atılmaya çalışılmaktadır. Geçmişi 1960’lara dayanan Yalın yaklaşımları da üretim alanında büyük kazanımlar sağlanmasından dolayı yazılım geliştirme alanı da dahil...
متن کاملYazılım Depoları Madenciliği ile Endüstriyel Yazılım Evrimi İncelemesi
Özet Yazılım evrimi alanında, açık kaynak yazılım geliştirmeden daha zengin veri içeren endüstriyel yazılımlar üzerinde daha fazla ampirik araştırma yapılmasına ihtiyaç vardır. Bu çalışmada, Yazılım Depoları Madenciliği (YDM) teknikleri kullanılarak endüstriyel bir yazılımın evrimi analiz edilmiştir. Veri kaynağı olarak kaynak kod depoları, hata depoları ve iletişim arşivlerini kullanmaya odakl...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: Anemon Mu? Alparslan Üniversitesi sosyal bilimler dergisi
سال: 2021
ISSN: ['2147-7655', '2149-4622']
DOI: https://doi.org/10.18506/anemon.888642